DAY 11 Canny - 擷取圖片中的邊緣 - iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

2023 iThome 鐵人賽

DAY 11

AI & Data

Diffusion 模型、物件偵測Yolo v7& Yolo v4 系列第 11 篇

DAY 11 Canny - 擷取圖片中的邊緣

15th鐵人賽

smitlea

團隊NUTC_IMAC_EFL

2023-09-22 19:05:34

464 瀏覽

分享至

tags: `第 16 屆 iThome 鐵人賽 (2023)`

{%hackmd BJrTq20hE %}

ControlNet透過添加附加條件來控制擴散模型的神經網路結構。提供了在文字到影像生成過程中使用條件輸入（例如塗鴉、邊緣圖、分割圖、姿勢關鍵點等）來增強穩定擴散的方法。生成的圖像將更接近輸入圖像，這比傳統的圖像到圖像生成方法有很大的改進。

ControlNet 模型可以使用小資料集進行訓練。然後整合任何預先訓練的穩定擴散模型來增強模型以實現微調。

下載canny模型

還記得我們的抱臉怪嗎? 沒錯ˋˇˊ 這一次的模型庫就是在Hugging face上面的可以自行下載

pip install opencv-contrib-python

controlnet-aux

OpenPose 處理器需要 controlnet-aux 軟體包。執行以下命令進行安裝：

pip install controlnet-aux
Uploading file..._439vf1ulg

xformers（可選）

xformers 套件可以提高推理速度。最新版本提供了對 PyTorch 1.13.1 的 pipwheels 支援。

pip install -U xformers

可以安裝conda來支援torch1.12.1或torch1.13.1

conda 安裝 xformers

好了，到這裡環境就搭建好了。

canny edge圖像生成

下面的範例就是使用canny edge ControlNet進行影像生成。它需要精細邊緣圖像作為輸入。

import cv2 
import numpy as np 
from PIL import Image 

image = Image.open('input.png') 
image = np.array(image) 

low_threshold = 100 
high_threshold = 200 

image = cv2.Canny(image, low_threshold, high_threshold) 
image = image[:, :, None] 
image = np.concatenate([image, image, image], axis=2) 
canny_image = Image.fromarray(image) 
canny_image.save('canny.png')